Extracción automática de un diccionario de colocaciones en español

نویسنده

  • Sulema Torres-Ramos
چکیده

Resumen. Las colocaciones son pares de palabras de contenido que forman las relaciones sintácticas de dependencia razonables, directamente o a través de palabras funcionales. Tales pares tienden usarse en los textos más frecuentemente de lo esperado por casualidad. El texto en lenguaje natural consiste casi totalmente de tales colocaciones. La información de las palabras que forman colocaciones es útil en diferentes aplicaciones de procesamiento de lenguaje natural. Actualmente existen corpus etiquetados con estructura sintáctica mismos que pueden ser útiles para la extracción de colocaciones. En este artículo se presenta la extracción automática de un diccionario estadístico grande de colocaciones a partir de un corpus con las estructuras sintácticas marcadas manualmente. Las relaciones de dependencias encontradas en tal corpus, junto con sus frecuencias, constituyen nuestro diccionario de colocaciones.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Ampliación de WordNet mediante extracción léxica a partir de un diccionario de sinónimos

1. Introducción El objetivo del experimento presentado en este trabajo es la expansión del WordNet gallego mediante extracción léxica a partir de un diccionario de sinónimos de esta lengua. El experimento se realiza dentro del proyecto coordinado SKATeR en el que nuestro grupo tiene como objetivo prioritario la construcción de Galnet, la versión gallega del WordNet 3.0. El marco de desarrollo e...

متن کامل

Extracción automática de contextos definitorios en textos especializados

Uno de los problemas recurrentes de cualquier área de conocimiento es la organización y explicación de los términos que incluye en su campo de estudio. El reciente avance en el desarrollo de nuevas tecnologías para el trabajo terminológico ha aportado diversas herramientas para tratar de resolver este problema. Una de estas herramientas son los corpus de textos especializados en los cuales se p...

متن کامل

Una Propuesta para el Etiquetado Automático de Roles Semánticos

Resumen: La identificación de los roles semánticos es una parte crucial en tareas que involucran tratamiento automático del lenguaje natural como la extracción y recuperación de información, sistemas de búsquedas de respuestas, generación de resúmenes, traducción automática, etc. Para el caso del español, la investigación en roles semánticos es escasa. El objetivo del actual trabajo es analizar...

متن کامل

Enriquecimiento automático de un léxico afectivo basado en relaciones semánticas obtenidas de un diccionario explicativo en español

Resumen. Las relaciones semánticas de sinonimia e hiperonimia son estudiadas y utilizadas en varios problemas de PLN. En este trabajo se estudian y procesan para incrementar las palabras en un léxico afectivo, con base en la determinación de patrones que utiliza el diccionario de la Real Academia de la Lengua Española en las definiciones de sustantivos y verbos. La definición de los diccionario...

متن کامل

Análisis Sintáctico Conducido por un Diccionario de Patrones de Manejo Sintáctico para Lenguaje Español

4 INTRODUCCIÓN 11 CAPÍTULO 1. RETROSPECTIVA HISTÓRICA DE LOS FORMALISMOS GRAMATICALES Y ALGUNAS HERRAMIENTAS EN LINGÜÍSTICA COMPUTACIONAL 31 CAPÍTULO 2. COMPILACIÓN DEL DICCIONARIO DE VERBOS ESPAÑOLES CON SUS ESTRUCTURAS DE VALENCIAS 121 CAPÍTULO 3. ANÁLISIS SINTÁCTICO Y DESAMBIGUACIÓN BASADA EN PATRONES DE MANEJO AVANZADOS 173 CAPÍTULO 4. COLECCIÓN DE ESTADÍSTICAS DE LAS COMBINACIONES DE SUBCA...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Research in Computing Science

دوره 70  شماره 

صفحات  -

تاریخ انتشار 2013